Mechanistic cardiac electrophysiology models allow for personalized simulations of the electrical activity in the heart and the ensuing electrocardiogram (ECG) on the body surface. As such, synthetic signals possess known ground truth labels of the underlying disease and can be employed for validation of machine learning ECG analysis tools in addition to clinical signals. Recently, synthetic ECGs were used to enrich sparse clinical data or even replace them completely during training leading to improved performance on real-world clinical test data. We thus generated a novel synthetic database comprising a total of 16,900 12 lead ECGs based on electrophysiological simulations equally distributed into healthy control and 7 pathology classes. The pathological case of myocardial infraction had 6 sub-classes. A comparison of extracted features between the virtual cohort and a publicly available clinical ECG database demonstrated that the synthetic signals represent clinical ECGs for healthy and pathological subpopulations with high fidelity. The ECG database is split into training, validation, and test folds for development and objective assessment of novel machine learning algorithms.
translated by 谷歌翻译
$ $With recent advances in CNNs, exceptional improvements have been made in semantic segmentation of high resolution images in terms of accuracy and latency. However, challenges still remain in detecting objects in crowded scenes, large scale variations, partial occlusion, and distortions, while still maintaining mobility and latency. We introduce a fast and efficient convolutional neural network, ASBU-Net, for semantic segmentation of high resolution images that addresses these problems and uses no novelty layers for ease of quantization and embedded hardware support. ASBU-Net is based on a new feature extraction module, atrous space bender layer (ASBL), which is efficient in terms of computation and memory. The ASB layers form a building block that is used to make ASBNet. Since this network does not use any special layers it can be easily implemented, quantized and deployed on FPGAs and other hardware with limited memory. We present experiments on resource and accuracy trade-offs and show strong performance compared to other popular models.
translated by 谷歌翻译
Neural processes (NPs) are models for transfer learning with properties reminiscent of Gaussian Processes (GPs). They are adept at modelling data consisting of few observations of many related functions on the same input space and are trained by minimizing a variational objective, which is computationally much less expensive than the Bayesian updating required by GPs. So far, most studies of NPs have focused on low-dimensional datasets which are not representative of realistic transfer learning tasks. Drug discovery is one application area that is characterized by datasets consisting of many chemical properties or functions which are sparsely observed, yet depend on shared features or representations of the molecular inputs. This paper applies the conditional neural process (CNP) to DOCKSTRING, a dataset of docking scores for benchmarking ML models. CNPs show competitive performance in few-shot learning tasks relative to supervised learning baselines common in chemoinformatics, as well as an alternative model for transfer learning based on pre-training and refining neural network regressors. We present a Bayesian optimization experiment which showcases the probabilistic nature of CNPs and discuss shortcomings of the model in uncertainty quantification.
translated by 谷歌翻译
生成高度详细的复杂数据是机器学习领域中的长期存在且经常考虑的问题。但是,开发细节感知的发电机仍然是一个具有挑战性和开放的问题。生成对抗网络是许多最新方法的基础。但是,他们引入了第二个网络作为损失函数训练,使对学习功能的解释变得更加困难。作为替代方案,我们提出了一种基于小波损耗公式的新方法,该方法在优化方面保持透明。在生成具有高频细节的数据时,基于小波的损耗函数用于克服常规距离指标(例如L1或L2距离)的局限性。我们表明,我们的方法可以在说明性合成测试案例中成功重建高频细节。此外,我们根据物理模拟应用于更复杂的表面时评估性能。以大致近似的模拟为输入,我们的方法在考虑它们的发展方式的同时进化了相应的空间细节。我们考虑了这个问题,从空间和时间频率方面,并利用训练有我们的小波损失的生成网络来学习表面动力学的所需时空信号。我们通过一组合成波函数测试以及弹性塑料材料的复杂2D和3D动力学测试方法的功能。
translated by 谷歌翻译
在本文中,我们考虑如何通过歧视措施来评估生存分布预测。这是一个非凡的问题,因为歧视措施是生存分析中最常用的,但没有明确的方法可以从分布预测中获得风险预测。我们调查文学和软件中提出的方法,并考虑各自的优缺点。虽然分布经常通过歧视措施评估,但我们发现该方法很少在文献中描述,并且经常导致不公平的比较。我们发现,降低风险分布的最强大方法是总结预测的累积危险。我们建议机器学习生存分析软件在分布和风险预测之间实现明确的转换,以便更透明和可访问的模型评估。
translated by 谷歌翻译
AI中的不同子场倾向于储存一小部分有影响力的基准。这些基准作为一系列涂抹的常见问题的支架运作,这些常见问题经常被录制为朝向灵活和更广泛的AI系统的道路上的基础里程碑。这些基准最先进的性能被广泛理解为表明对这些长期目标的进展。在这个位置纸中,我们探讨了这种基准的限制,以便在其框架中揭示构建有效性问题,作为功能“一般”的进展措施,他们被设置为。
translated by 谷歌翻译
端到端的自主驾驶旨在以集成的方式解决感知,决策和控制问题,这可以更容易地进行大规模推广并更适合新方案。但是,高成本和风险使在现实世界中训练自动驾驶汽车变得非常困难。因此,模拟可以成为实现培训的强大工具。由于观察到略有不同的观察结果,在模拟中受过训练和评估的代理通常在那里表现良好,但在现实环境中遇到困难。为了解决这个问题,我们提出了一种新型基于模型的强化学习方法,称为cycleconsisterstent世界模型。与相关方法相反,我们的模型可以在共享的潜在空间中嵌入两种方式,从而从一个模态(例如模拟数据)中从样本中学习,并用于在不同域中的推断(例如,现实世界数据)。我们使用Carla模拟器中不同模态的实验表明,该CCWM能够超过最先进的域适应方法。此外,我们表明CCWM可以将给定的潜在表示解码为两种模式的语义相干观测。
translated by 谷歌翻译
露天矿山留下了许多全世界地区,不管怎样或无法居住。要将这些地区送回使用,整个土地必须转向化。对于可持续的随后使用或转移到新的主要用途,必须永久管理许多受污染的地点和土壤信息。在大多数情况下,此信息以非结构化数据集合或文件文件夹中的专家报告的形式提供,在最佳情况下是数字化的。由于数据的大小和复杂性,一个人难以概述该数据,以便能够进行可靠的陈述。这是将这些地区快速转移到使用后最重要的障碍之一。基于信息的方法支持本问题支持履行有关环境问题,健康和气候行动的几个可持续发展目标。我们使用一堆光学字符识别,文本分类,主动学习和地理信息系统可视化,以有效地挖掘并可视化这些信息。随后,我们将提取的信息链接到地理坐标并使用地理信息系统可视化它们。主动学习发挥着重要作用,因为我们的数据集不提供培训数据。总共,我们处理九个类别,并积极学习其数据集中的表示。我们分别评估OCR,主动学习和文本分类,以报告系统的性能。主动学习和文本分类结果是双重的:而我们关于限制的类别足够的工作($> $。85 F1),为人类编码人员复杂化了七个主题类别,因此取得了平庸的评价分数($ <$。70 F1)。
translated by 谷歌翻译
药物发现和发展是一个复杂和昂贵的过程。正在研究机器学习方法,以帮助提高药物发现管道多个阶段的有效性和速度。其中,使用知识图表(kg)的那些在许多任务中具有承诺,包括药物修复,药物毒性预测和靶基因疾病优先级。在药物发现kg中,包括基因,疾病和药物在内的关键因素被认为是实体,而它们之间的关系表示相互作用。但是,为了构建高质量的KG,需要合适的数据。在这篇综述中,我们详细介绍了适用于构建聚焦KGS的药物发现的公开使用来源。我们的目标是帮助引导机器学习和kg从业者对吸毒者发现领域应用新技术,但是谁可能不熟悉相关的数据来源。通过严格的标准选择数据集,根据包含内部包含的主要信息类型,并基于可以提取的信息来进行分类以构建kg。然后,我们对现有的公共药物发现KGS进行了比较分析,并评估了文献中所选择的激励案例研究。此外,我们还提出了众多和与域及其数据集相关的众多挑战和问题,同时突出了关键的未来研究方向。我们希望本综述将激励KGS在药物发现领域的关键和新兴问题中使用。
translated by 谷歌翻译